中信建投:全球大模型迭代 看好国内AI加速赶超海外
中信建投证券发布研报称,海外GPT-5.1更新围绕效率和个性化升级,国内模型同样加速迭代。百度(09888)文心5.0多模态理解能力较为突出,有望为后续模型迭代提供更丰富的数据语料。MiniMax M2和Kimi k2 Thinking接连荣登开源模型榜首,前
中信建投证券发布研报称,海外GPT-5.1更新围绕效率和个性化升级,国内模型同样加速迭代。百度(09888)文心5.0多模态理解能力较为突出,有望为后续模型迭代提供更丰富的数据语料。MiniMax M2和Kimi k2 Thinking接连荣登开源模型榜首,前
AI投资步入第二赛季,从海外加密货币到美股。由RockAlpha平台主导的美股赛场,为AI模型设置了多个风格迥异的策略赛道,让多个AI模型进行实盘交易;以及由港大AI-Trader项目开辟的A股赛场,其规则深度贴合本土市场,专攻上证50指数成分股。这两大实验首
人工智能越聪明,对齐问题就越紧迫。根据Anthropic 的 Claude Sonnet 4.5 系统卡( 基本上是人工智能模型架构和功能的概述 ), 该公司这次面临着一个有趣的挑战:如何防止人工智能察觉到自己正在接受测试。
结果显示,不管是GPT-5,还是Claude Sonnet、Gemini,亦或是主打通用Agent的Manus,都统统被人类接单首踩在泥土里,真实水平垫底。
• 顶级编码能力:专为端到端开发工作流设计,它在 Claude Code、Cursor、Cline、Kilo Code 和 Droid 等众多应用中表现出色。• 强大的代理性能:它展示了出色的规划能力和对复杂、长链工具调用任务的稳定执行,协调对 Shell、浏
在最新发布的Claude for Life Sciences中,Anthropic把一件事说得很直白:AI不只是帮科研人员“写代码、做摘要”的辅助工具,而是要逐步成为“从基础研究到临床转化与商业化”的全流程伙伴。更关键的是,凭借 Claude Sonnet 4
10月27日,来自中国的AI独角兽公司MiniMax稀宇极智正式发布并开源其新一代文本大模型——MiniMax-M2。这款仅有10B激活参数(总参230B)的轻量级模型,在保持优越性能的同时,实现了更低的延迟与成本,以及更高的吞吐效率,契合了新兴多智能体工作流
周日晚上,都准备去睡觉了。结果在 X 上刷到一条消息,有个国外的博主说,MiniMax 的 M2 模型将会成为中国最好的模型,与 Sonnet 4.5 旗鼓相当。
MiniMax(稀宇极智)发布并开源新一代文本大模型MiniMax-M2,在全球权威测评榜单Artificial Analysis (AA)中总分位列全球前五、开源第一,跻身全球第一梯队,与OpenAI、谷歌等硅谷巨头同台竞技,这也是中国开源大模型首次在该榜单
全球六大LLM实盘厮杀,新王登基!今天,Qwen3 Max凭借一波「快狠准」操作,逆袭DeepSeek夺下第一。
Claude 作为 Anthropic 推出的基础模型,因功能强大、擅长协作而获得研究人员青睐。科研人员通常使用 Claude 处理独立任务,例如编写统计分析代码或总结论文。
真正的科研利器诞生了!Claude生命科学版出世,搭载最强Claude Sonnet 4.5,实验基准碾压人类。不论是统计代码编写,还是文献总结,AI数小时搞定数月课题。
这项由上海交通大学彭维涵、石雨灵、王宇航、张欣云、沈备军和顾晓东(通讯作者)团队完成的开创性研究发表于2025年9月,论文编号为arXiv:2509.14635v1。有兴趣深入了解的读者可以通过该编号查询完整论文。
先简单科普一下,Claude 家族有三个不同参数量级的模型:Claude Opus(大杯)、Sonnet(中杯)和 Haiku(小杯)。
“GLM-4.6是我用过最棒的编程模型”、“这是我用过最具性价比的编程助手”,不少一线开发者在亲身体验后给出高度评价。还有多位海外AI领域的知名创业者、KOL专门发文推荐。以GLM-4.6为关键词在YouTube搜索,已经能找到十几条深度测评视频,从开发体验到
一款国产编程模型,在海外狂飙的15天。作者 |陈骏达编辑 |漠影这款国产编程模型,正在海外悄悄爆火!国庆前夕,国产开源AI迎来一波集中发布,体验中国制造的开源模型,成了一众海外开发者们今年独特的“国庆七天乐”。在X平台、Reddit和YouTube上,智谱于9
「AI教父」Hinton毕生致力于让机器像大脑般学习,如今却恐惧其后果:AI不朽的身体、超凡的说服力,可能让它假装愚笨以求生存。人类对「心智」的自大误解,预示着即将到来的智能革命。
自 2025 年起,AI 业内先后推出了 Cursor、Gemini CLI、Qwen CLI、GPT-codex 等基于大模型的自动化代码生成工具,展现了 AI 发展的下一个风口——即利用大模型调用各种分析工具,更好地完成自动化代码生成或辅助人类更快速地进行
Anthropic 发布了最新模型 Claude Sonnet 4.5 的安全性分析,并透露该模型怀疑自己正在被测试。
sonnet claude ant claudesonnet 2025-10-03 09:31 6
深夜的办公室里,只有键盘声作响——但敲击代码的并非人类程序员,而是一个持续工作了30小时的AI。这不是科幻电影,而是Anthropic公司最新发布的Claude Sonnet 4.5展现的现实能力。
编程 sonnet claude claudesonnet 2025-10-02 09:14 4